iT邦幫忙

2025 iThome 鐵人賽

DAY 21
0
自我挑戰組

日誌檢查學習自我挑戰系列 第 21

Day21:網路的高可用性與容錯設計

  • 分享至 

  • xImage
  •  

在任何企業網路中,預設閘道 (Default Gateway) 都是最常見的單點故障 (Single Point of Failure, SPoF)。為了避免一旦路由器故障導致整個子網路與外界斷線,我們必須實作 首跳冗餘協定 (FHRPs),例如 HSRP (Cisco 專有) 或 VRRP (開放標準)。

冗餘閘道協定的核心原理
VRRP 和 HSRP 的目標是讓多臺實體路由器能夠共用一個虛擬閘道。對客戶端設備而言,它們始終只將一個 IP 地址設定為其預設閘道,且不會感知到後端發生的切換。

1.虛擬 IP (Virtual IP, VIP): 客戶端配置的預設閘道 IP。這個 IP 始終由網路中的 Active/Master 路由器擁有。
2.虛擬 MAC (Virtual MAC, VMAC): 協定分配的一個共用 MAC 地址。所有發往閘道的封包都發送到這個 VMAC,這確保了切換時客戶端的 ARP 表格不需要更新。
3.Active/Master 路由器: 實際負責轉發所有流量的設備。
4.Standby/Backup 路由器: 監聽 Active 路由器的狀態,隨時準備在故障時接管工作。

運作流程:故障切換與無縫接管
VRRP/HSRP 的核心價值在於它能在幾秒內實現無感知的故障切換 (Failover):

1.角色確定: 路由器們透過優先級 (Priority) 投票,選出擁有最高優先級的路由器成為 Active/Master。
2.心跳維護: Active 路由器會週期性地發送 Hello 訊息(HSRP 預設 3 秒),向 Standby 路由器證明自己仍在運作。
3.故障發生與 Timeout: 當 Active 路由器發生故障,Standby 路由器在預定的 Holdtime/Dead Timer(通常是 Hello 間隔的 3 倍)內未收到 Hello 訊息。
4.接管 (Takeover): Standby 路由器立即宣告自己成為新的 Active 路由器,接管 VIP 和 VMAC。整個切換過程對客戶端是透明且無縫的。

故障排除與最佳實踐
僅僅配置 Active/Standby 不足以應對所有複雜故障。
1.搶佔機制 (Preemption): 允許原 Active 路由器在故障修復後,重新奪回主動權。雖然它確保了流量始終走在性能最好的設備上,但每次搶佔都會造成短暫的連線中斷,因此在極度穩定的環境中需要謹慎評估。
2.介面追蹤 (Interface Tracking): 這是實現真正冗餘的關鍵。如果 Active 路由器的上游 WAN 介面故障(例如 ISP 線路中斷),路由器本身雖然還在運行,但已失去出口能力。配置介面追蹤後,一旦追蹤的介面 Down,Active 路由器的優先級會自動降低,從而觸發 Standby 路由器接管,將流量導向另一條健康的出口路徑。


上一篇
DAY20:SNMP 協定與設備性能監控
系列文
日誌檢查學習自我挑戰21
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言